Projekt

Livsstilsfaktorer och studieresultat - Vilka livsstilsfaktorer påverkar studieresultaten för studenter?

Författare
Ebba Geldern
Ida Gerdin
Linnéa Jones
Linnéa Lärka


Datasetet kommer ifrån en studie som undersöker livsstilsfaktorer hos studenter i åldrarna 17–24. Studien innefattade 1000 observationer och innehöll 16 variabler. Livsstilsfaktorerna vi har undersökt är sociala medier, sömn, psykisk hälsa och träning och om det har någon påverkan på studieresultatet hos studenter beroende på kön. Detta är en självskattningsstudie.

Frågeställning: Vilka livsstilsfaktorer påverkar studenters studieresultat baserat på kön?


Studieresultat fördelat på kön

student_habits_performance %>%
  ggplot(aes(x = gender, y = exam_score)) +
  geom_boxplot(fill = "lightblue", color = "black") +
  labs(
    title = "Fördelning av studieresultat fördelat på kön",
    x = "Kön",
    y = "Studieresultat (poäng)"
  ) +
  theme_minimal()

Detta boxplot visualiserar fördelningen av studieresultat baserat på kön. Vi kan se att medianen för studieresultaten inte skiljer sig åt mellan könen, vilket indikerar att det inte finns några större skillnader i prestation beroende på kön.


Studieresultat baserat på antal timmar som spenderas på sociala medier fördelat på kön

plot <- student_habits_performance %>%
  ggplot(mapping = aes(x = social_media_hours, y = exam_score, color = gender)) +
  geom_point() +  
  geom_smooth(method = "lm", aes(group = gender), se = FALSE, linetype = "solid") + 
  labs(
    title = "Studieresultat baserat på antal timmar sociala medier fördelat på kön",
    x = "Sociala medier (Timmar)",
    y = "Studieresultat (poäng)",
    color = "Kön"
  ) +
  scale_color_manual(values = c("Female" = "#8ecae6", "Male" = "#023047", "Other" = "#fb8500"))

ggplotly(plot)

Detta spridningsdiagram visar sambandet mellan antal timmar på sociala medier och studieresultat, med kön som färgkodning. Alla tre trendlinjer lutar svagt nedåt, vilket tyder på ett negativt samband mellan tid på sociala medier och studieresultat.


Studieresultat baserat på antal timmar sömn fördelat på kön

plot <- student_habits_performance %>%
  ggplot(mapping = aes(x = sleep_hours, y = exam_score, color = gender)) +
  geom_point() +  
  geom_smooth(method = "lm", aes(group = gender), se = FALSE, linetype = "solid") + 
  labs(
    title = "Studieresultat baserat på antal timmar sömn fördelat på kön",
    x = "Sömn (Timmar)",
    y = "Studieresultat (poäng)",
    color = "Kön"
  ) +
  scale_color_manual(values = c("Female" = "#8ecae6", "Male" = "#023047", "Other" = "#fb8500"))

ggplotly(plot)

Detta spridningsdiagram visar sambandet mellan antal timmar sömn och studieresultat. Sambandet är ganska likartat för kvinnor och män, något svagare för kategorin “annat”.


Studieresultat baserat på skattad psykisk hälsa fördelat på kön

plot <- student_habits_performance %>%
  ggplot(mapping = aes(x = mental_health_rating, y = exam_score, color = gender)) +
  geom_point() +  
  geom_smooth(method = "lm", aes(group = gender), se = FALSE, linetype = "solid") + 
  labs(
    title = "Studieresultat baserat på psykisk hälsa fördelat på kön",
    x = "Psykisk hälsa (1–10)",
    y = "Studieresultat (poäng)",
    color = "Kön"
  ) +
  scale_color_manual(values = c("Female" = "#8ecae6", "Male" = "#023047", "Other" = "#fb8500"))

ggplotly(plot)

Detta spridningsdiagram visar att ju högre studenterna skattar sin psykiska hälsa, desto högre är deras studieresultat – oavsett kön.


Studieresultat baserat på antal träningspass per vecka fördelat på kön

plot <- student_habits_performance %>%
  ggplot(mapping = aes(x = exercise_frequency, y = exam_score, color = gender)) +
  geom_point() +  
  geom_smooth(method = "lm", aes(group = gender), se = FALSE, linetype = "solid") +  
  labs(
    title = "Studieresultat baserat på antal timmar träning fördelat på kön",
    x = "Träningspass (Vecka)",
    y = "Studieresultat (poäng)",
    color = "Kön"
  ) +
  scale_color_manual(values = c("Female" = "#8ecae6", "Male" = "#023047", "Other" = "#fb8500"))

ggplotly(plot)

Detta spridningsdiagram visar ett svagt positivt samband mellan träning och studieresultat. Effekten är liten, men konsekvent över kön.


Summering

library(patchwork)

long_df <- student_habits_performance |>
  pivot_longer(
    cols = c(social_media_hours, sleep_hours, mental_health_rating, exercise_frequency),
    names_to = "variable",
    values_to = "value"
  ) |>
  mutate(
    variable = recode(variable,
                      "social_media_hours" = "Tid på sociala medier (Timmar)",
                      "sleep_hours" = "Sömn (Timmar)",
                      "mental_health_rating" = "Psykisk hälsa (1-10)",
                      "exercise_frequency" = "Träningspass (Vecka)")
  )

make_plot <- function(var_name, x_label) {
  ggplot(filter(long_df, variable == x_label), aes(x = value, y = exam_score, color = gender)) +
    geom_point(alpha = 0.6) +
    geom_smooth(method = "lm", se = FALSE) +
    scale_color_manual(values = c("Female" = "#8ecae6", "Male" = "#023047", "Other" = "#fb8500")) +
    labs(
      title = x_label,
      x = x_label,
      y = "Studieresultat (poäng)",
      color = "Kön"
    ) +
    theme_minimal()
}

labels <- c(
  "Tid på sociala medier (Timmar)",
  "Sömn (Timmar)",
  "Psykisk hälsa (1-10)",
  "Träningspass (Vecka)"
)

plots <- lapply(labels, function(lbl) make_plot("variable", lbl))

wrap_plots(plots, ncol = 2) +
  plot_annotation(title = "Samband mellan olika faktorer och studieresultat")

Resultaten visar tydliga samband mellan livsstilsfaktorer och studieresultat, där psykisk hälsa och låg tid på sociala medier framstår som de starkaste indikatorerna.